Vision 模块提供了用于文本识别的 API。
支持从静态图片中识别文本,或者通过相机扫描文档并提取文本内容。
RecognizedText表示单个识别到的文本块。
content: string
识别到的文本内容。
confidence: number
置信度(0.0 到 1.0 之间),1.0 表示最高置信度。
boundingBox: { x: number, y: number, width: number, height: number }
文本所在的矩形区域,使用归一化坐标表示。
RecognizeTextOptions文本识别的配置选项。
recognitionLevel?: "accurate" | "fast"
识别模式:
"accurate"(默认):优先保证准确度。"fast":优先保证速度。recognitionLanguages?: string[]
识别时优先使用的语言数组(ISO 语言编码)。
usesLanguageCorrection?: boolean
是否在识别过程中应用语言自动纠错。
minimumTextHeight?: number
最小识别文本高度,相对于图片高度(默认 0.03125)。
customWords?: string[]
补充词汇表(只在启用语言纠错时生效)。
recognizeText(image: UIImage, options?: RecognizeTextOptions): Promise<{ text: string, candidates: RecognizedText[] }>对指定图片进行文本识别。
参数:
image:要识别的 UIImage 对象。options (可选):文本识别配置。返回:
返回 Promise,包含:
text:识别出的完整文本。candidates:识别出的文本块数组及详细信息。scanDocument(options?: RecognizeTextOptions): Promise<string[]>使用相机扫描文档并识别文本。
参数:
options (可选):文本识别配置。返回:
返回 Promise,包含识别到的文档文本数组。
如果用户取消,Promise 将抛出错误。